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摘 要 : 针对 股票 市 场 关系 复杂 导致 的 有 效 特 征 提取 困难 、 价 格 预测 精度 低 等 问题 ， 提 出 一 种 基于 动态 模 态 分 解 - 
长 短期 记忆 神经 网 络 (DMD-LSTM) 的 股票 价格 时 间 序 列 预测 方法 。 首 先 通 过 DMD 算法 对 受 市 场 板 块 联动 效应 影 
响 的 关联 行业 板块 样本 股 数据 进行 分 解 计 算 ， 提 取 包 人 金 整 体 市 场 和 特定 股票 走势 变化 信息 的 模 态 特征 ; 然后 针对 不 
同市 场 背景 ， 采 用 LSTM 网 络 对 基本 面 数据 和 模 态 特征 进行 价格 建 模 预 测 。 在 鞍钢 股份 〈sh600000) 上 的 实验 结果 
表明 ， 该 方法 相 较 于 传统 预测 方法 ， 在 特定 的 市 场 背 景 下 能 实现 更 高 的 价格 预测 精度 ， 更 为 准确 地 描述 股票 价格 的 
ee 
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Research of stock price prediction based on dmd-lstm model 


Shi Jiannan!, Zou Junzhong!', Zhang Jianl Wang Chunmei2, Wei Zuochen! 
(1. College of Information Science & Engineering, East China University of Science & Technology, Shanghai 200237, 
China; 2. College of Information Mechanical & Electrical Engineering, Shanghai Normal University, Shanghai 200234, 
China) 


Abstract: Aiming at the problems of low prediction accuracy and feature extraction difficulty in complicated stock market, 
this paper proposed a stock price prediction method based on dynamic mode decomposition and long short-term memory 
neural network (DMD-LSTM) . Firstly, it used the DMD algorithm to decompose the industry Specific stock in the 
background of plate linkage phenomenon, and extracted the mode feature which included stock trend information. Then, 
built the LSTM network to establish the relations between stock price and the feature of mode and basic index in different 
market conditions. The experimental results on Angang Steel (sh600000) Show that, the proposed method has the higher 
forecasting precision compared with the traditional ways in Specific condition, which can characterize the trend of stock 
price changes better . 
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GO 0 引言 中 ， 很 多 行情 的 大 幅 变化 通常 由 多 个 板块 带动 发 展 而 来 中。 
全 六 忆 此 借助 相关 行业 板块 趋势 变化 来 发 掘 潜在 关联 信息 ， 在 股 
股票 市 场 作为 国家 经 济 的 晴雨 表 ， 已 经 成 为 国家 经 济 发 票 价 格 预测 上 具有 重要 的 研究 意义 。 


hual 


展 不 可 或 缺 的 一 部 分 。 由 于 股票 市 场 的 重要 性 ， 通 过 分 析 挖 由 于 股票 市 场 数据 指标 众多 且 存 在 高 维 非 线性 的 特性 ， 
昌 股 市 历史 数据 和 各 项 技术 指标 ， 并 依据 相关 理论 和 算法 模 目前 的 价格 股票 预测 方法 主要 是 将 数据 特征 提取 和 模型 预测 
型 来 预测 市 场 的 价格 走势 情况 具有 重要 的 理论 意义 和 社会 价 ”过 程 相 结合 来 进行 研究 。 比 如 Xu 等 人 中 采取 改进 的 经 验 模 
值 趾 。 股 票 市 场 作为 复杂 且 时 变 的 巨 系统 ， 其 价格 波动 往往 ” 态 分 解 算法 CEEMD ) 对 股票 时 间 序 列 进行 模 态 分 解 ， 并 根 
表现 为 较 强 的 非 线性 所 ， 因 此 如 何 从 海量 的 市 场 数据 中 获取 ” 据 分 解 得 到 的 模 态 信息 成 功 预 测 市 场 价格 趋势 ; Mann 四 将 动 
有 价值 的 信息 为 决策 服务 是 一 个 难点 。 态 模 态 算 法 (DMD ) 用 于 证 券 市 场 这 个 高 维 非 线 性 系统 的 信 
股票 市 场 中 ， 不 同行 业 板 块 间 的 股票 价格 和 收益 率 波动 息 提 取 上 ,并 利用 时 空 相 干 性 结构 信息 来 表征 系统 动态 特征 ， 
变化 往往 存在 着 一 定 的 关联 性 , 通常 称 之 为 联动 效应 Bradly ”准确 的 描述 了 市 场 价格 变化 和 形态 走势 ， 李 晋 外 利用 离散 小 
Bl 采用 方差 分 析 法 对 同一 证 券 市 场 不 同 板 块 股价 联动 效应 波 分 析 来 挖掘 期 货 价 格 序 列 中 隐 含 的 趋势 信息 ， 然 后 引入 支 
行 深入 研究 ， 发 现 标 普 指数 下 不 同行 业 指数 间 存 在 明显 的 联 ” 持 向 量 机 对 重 构 的 小 波 系 数 进行 训练 , 大 大 提高 了 预测 精度 ; 
动 效 应 ; 周 武 由 在 对 国内 A 股市 场 多 组 行业 板块 进行 分 析 后 ”郭志 强 09 利 用 多 线性 主 成 分 分 析 法 (MPCA) 进行 特征 提取 
发 现 , 不 同市 场 经 济 周期 下 行业 板块 联动 效应 存在 明显 差异 ; 和 数据 降 维 , 并 结合 RBF 神经 网 络 在 日 经 指数 上 进行 了 建 模 
魏 国 林 馈 利用 数据 挖掘 技术 分 析 得 出 我 国 股市 行业 板块 间 的 研究 ; 史 文 静 ! 岂 对 股指 期 货 价 格 序 列 采用 EMD 算法 得 到 IMF 
联动 效应 高 于 板块 内 各 股 联动 效应 。 而 在 国内 股市 发 展 历程 。 本 征 模 函 数 ， 并 结合 RBF 神经 网 络 对 提取 出 高 低频 IMF 进 
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录用 定稿 史 建 杭 ， 等 : 基于 DMD-LSTM 模型 的 股票 价格 时 间 序 列 预 测 研究 第 37 卷 第 3 期 
行 建 模 来 实现 价格 预测 。 进行 约 化 SVD 分 解 ， 并 进行 转换 可 得 

当前 的 股票 预测 方法 大 多 直接 选取 市 场 数 据 为 研究 对 XY =U ZV"S 0) 
象 ， 没 有 考虑 板块 联动 效应 下 关联 行业 板块 整体 走势 间 的 影 $=V EWU XI (8) 
响 和 潜在 关联 因素 ; 在 特征 提取 方面 对 数据 进行 降 维和 转换 §=UsX#"V E11=UsAU=A (9) 
等 操作 ， 缺 乏 业务 可 解释 性 ， 预 测 模型 通常 选取 以 统计 学 理 将 计算 算 阵 4 的 特征 值 问题 转换 为 计算 和 矩阵 $ 的 特征 值 
论 为 基础 的 时 间 序 列 分 析 方 法 和 传统 机 器 学 习 方 法 ， 其 在 非 ”uw 和 特征 矢量 x ， 特 征 值 w 包含 着 以 At 为 时 间 间 隔 的 系统 
线性 时 间 序 列 预 测 准 确 性 和 时 序 信 息 利用 方面 均 存 在 不 足 。 向 下 一 个 时 刻 状 态 变化 的 时 间 动 态 特 征 

针对 以 上 问题 ， 本 文 从 关联 行业 板块 存在 的 联动 效应 出 8 大 2 大 (10) 
发 ， 首 先 针 对 不 同 算法 分 别 进行 数据 集 构造 ， 并 通过 DMD 系统 的 DMD 动态 模 态 可 以 由 和 矩阵 A 第 大 个 特征 矢量 yw 
(动态 模型 分 解 ) 算 法 对 关联 行业 板块 下 样本 股 数据 进行 分 。 表示 ， 根 据 相似 矩阵 的 性 质 可 得 
解 计算 ， 提 取代 表 行业 板块 的 市 场 整体 趋势 以 及 股票 自身 价 Wr Uy CD) 
格 趋势 信息 的 模 态 特征 。 后 续 利 用 LSTM 神经 网 络 对 非 线性 最 终 , 利用 和 w 可 以 实现 系统 当前 状态 重 构 和 将 来 状 
时 间 序 列 良 好 的 拟 合 预测 能 力 ， 分 别 构建 LSTM 模型 对 不 同 。 态 预 测 。 改 写 特征 值 形式 为 &.=In(44)/A+， 则 系统 1 时 刻 截面 


市 场 背 景 下 股票 基本 面 数据 和 模 态 特征 进行 学 习 ， 最 终 建 立 ”数据 可 以 表示 为 
基于 DMD-LSTM 模型 的 股票 价格 预测 方法 及 其 融合 模型 。 
通过 将 不 同市 场 背景 下 的 模型 预测 结果 与 传统 的 机 器 学 习 方 
法 进行 分 析 对 比 ， 检 验 模 型 的 有 效 性 。 其 中 : 4b.(00) 为 模 态 初始 幅 值 ，Y 为 特征 向 量 wi 组 成 的 矩阵 ， 
pe diag(o) 是 对 角 元 为 exp(@) 的 对 角 阵 ，b 为 b.(0) 构成 的 向 量 。 
1 ”算法 原理 向 量 b 通过 0 时 刻 的 截面 数据 进行 求解 ， 利 用 DMD 进行 


Xpup(t) = 2 bi (OW (x) exp(@t) = Pdiag (exp(wt)) b (12) 
大 =1 


1.1 DMD 算法 状态 重 构 得 到 ， 然 后 求 矩 阵 伪 逆 即 可 。 

DMD (dynamic mode decomposition ) 动态 模 态 分 解 A =xpup(0)= diag(exp(0) p=:b (13) 
Schmid 提出 ， 并 应 用 于 流体 分 析 、 复 杂 系 统 构建 以 及 数据 b= Tn (14) 
之 掘 方面 (4。DMD 算法 围绕 Koopman 算 符 发 展 而 来 ， 其 创 DMD 算法 通过 提取 低 维 动态 特征 来 表征 系统 变化 ， 实 


新 性 的 结合 了 时 间 维 度 上 的 功率 谱 分 析 和 空间 维度 上 的 主 成 ” 现 以 线性 映射 去 最 优 拟 合 系统 的 非 线 性 动态 情况 ， 最 终 利用 
分 分 析 的 特点 ， 通 过 将 时 间 序 列 数据 分 解 为 特征 值 和 特征 向 ” 提取 的 DMD 动态 模 态 实现 对 系统 任意 时 刻 的 状态 估计 。 

量 ， 将 高 维 非 线性 系统 近似 简化 为 低 维 线性 系统 表示 ， 最 终 。 1.2 LSTM 神经 网 络 

实现 系统 当前 状态 重 构 和 短期 状态 预测 1。 循环 神经 网 络 (RNN) 是 目前 较为 流行 的 应 用 于 时 间 序 
设 w, 加 …,xm 为 原始 数据 中 M 个 时 间 序 列 截面 数据 ， 每 ” 列 预 测 的 神经 网 络 模型 。 传 统 的 前 向 神经 网 络 比如 BPNN， 
个 时 间 序 列 截面 数据 包含 N 个 样本 ， 记 为 VxM 矩阵 ”神经 元 信号 只 能 单 向 流动 ， 导 致 对 样本 的 处 理 在 时 间 上 是 独 
X=[p…20]， 称 为 数据 快照 (data shot) 。 立 的 ， 对 时 间 序 列 数据 而 言 损 失 了 重要 的 时 序 信息 094。RNN 
根据 Koopman 算 符 线性 映射 的 思想 , 总 能 找到 一 个 矩阵 ”在 传统 神经 网 络 结构 基础 上 进一步 对 隐 层 神经 元 之 间 也 引入 
4 使 得 系统 下 一 时 刻 的 状态 由 上 一 时 刻 的 状态 进行 表示 ， 即 “了 权 连 接 ， 使 得 隐 层 神经 元 每 个 时 刻 的 输出 都 依赖 于 之 前 时 


4=Ax)。 将 数据 快照 数据 表示 为 Krylov 子 序列 形式 刻 的 信息 ， 网 络 单元 既 存 在 前 馈 连接 又 有 内 部 反馈 连接 ， 实 
KH [Dee Ke] = [A A AM2N] (1) ” 现 了 动态 时 序 行为 在 神经 网 络 单元 内 部 状态 的 转换 。 

XH = [6, ,x ] = AXHT (2) 但 在 实际 应 用 中 , RNN 存在 梯度 消失 和 梯度 爆炸 导致 的 

和 矩阵 4 为 系统 由 Xf" 向 X 吉 状态 演变 规律 的 线性 估计 ， 期 依赖 问题 , 使 得 其 无 法 应 用 于 较 长 时 间 序列 数据 的 建 模 。 


量 ) 的 加 权 线 性 组 合 来 表示 : 型 作为 RNN 的 一 种 完善 成 功 解决 了 上 述 问 题 。LSTM 利 
如 特定 的 记忆 单元 代替 了 RNN 链 式 结构 中 的 隐 层 节点 ， 实 


长 
则 X 近 中 xzr 可 以 由 上 一 个 时 刻 如 中 线性 独立 的 去 《〈 列 矢 而 由 Grves05 改 进 提 出 的 LSTM (Long Short-Time Memory) 
模 
入 二 用 
Xu = nxn tr =XM atr (3) a 入 和 A i S 
呆 现 了 时 序 信息 保留 和 长 期 记忆 的 能 力 。 图 1 为 LSTM 中 的 记 


其 中 :a 为 加 权 线 性 组 合 的 权 值 矢 量 ，" 为 长 度 为 N 的 残 差 忆 单 元 结构 。 
矢量 。 根 据 上 式 可 得 关系 : LSTM 记忆 单元 的 主要 结构 是 门 (gates) 和 记忆 细胞 


AXY = XY = XH"S + re (4) (cell)， 门 结构 可 以 让 信息 选择 性 的 通过 实现 信息 的 去 除 或 

e8- 为 单位 矢量 ， 通 过 极 小 化 残 差 矩阵 re 来 寻找 和 矩阵 者 增加 ， 实 现 记忆 细胞 状态 的 保持 和 更 新 ， 具 体 包括 输入 门 

4 分 解 后 最 优 的 低 维特 征 值 和 特征 矢量 ， 可 以 使 得 系统 估计 (input gates) 、 输 出 门 (output gates)、 遗 忘 门 (forget gates); 
值 和 目标 x 最 接近 。5 为 低 维 近似 矩阵 ， 和 矩阵 4 的 特征 值 可 记忆 细胞 负责 存储 细胞 状态 信息 。 


和 矩阵 5 的 特征 值 来 近似 蔡 代 。 遗忘 门将 当前 时 刻 的 输入 值 x? 和 上 一 时 刻 的 隐藏 状态 
0 值 ?作为 sigmoid 函数 的 输入 ， 产 生 一 个 [0,1] 的 权 值 输出 
1 0 a, Jo 。 权 值 可 看 做 记忆 单元 遗忘 上 细胞 状态 的 概率 ， 通 
Sl : (5) ”过 将 f° 乘 以 记忆 单元 上 一 刻 的 细胞 状态 C 中 来 控制 上 一 单 
1 0 ax 元 信息 被 保留 程度 。 
1 a Jo =a(W [hd, x0]+b,) (15) 
矩阵 8 最 后 一 列 矢量 4 的 值 可 以 表示 为 输入 门 利用 sigmoid 函数 和 tanh 函数 配合 来 控制 能 够 进 
CKP xu (6) 。 入 细胞 状态 的 新 输入 信息 的 量 。 其 中 tanh 函数 生成 新 信息 
实际 求解 中 抢 阵 $ /为 性 质 通常 较 差 不 易 求 解 ， 因 此 进 Co ，sigmoid 函数 产生 [0,1] 的 权 值 来 控制 进入 细胞 状态 的 信 


步 采用 $ 的 相似 矩阵 8 来 进行 计算 求解 .对 式 (5) 中 矩阵 X 息 量 大 小 。 进 一 步 将 输入 门 和 遗忘 门 相 结 合 就 可 以 实现 将 细 
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胞 状态 由 Cm 更 新 为 C?。 


i? =o(W [hm , x0]+b,) (16) 
Co =tanh(W, -[h DD, x0]+b,) (17) 
CO=fO#CD +iO *#CD (18) 


输出 门 通过 对 当前 细胞 状态 c" 使 用 tanh 函数 进行 处 理 


得 到 进入 下 一 时 刻 的 细胞 状态 信息 ， 然 后 配合 sigmoid 函数 
得 到 的 权 值 co" 来 控制 细胞 状态 信息 的 过 滤 程 度 , 并 最 终 得 到 


下 一 时 刻 的 隐藏 信息 加 。 


息 流 的 控 秆 


om =o(W, [hd, xO]+b,) (19) 
Ho =ow#tanh(CO) (20) 

LSTM 通过 更 换 RNN 链 式 结构 中 记忆 单元 实现 了 对 信 

1， 较为 成 功 的 解决 了 RNN 中 出 现 的 梯度 问题 ， 


实现 了 长 周期 信息 的 记忆 。 目前 LSTM 已 经 在 多 种 时 间 序 列 
数据 预测 上 获得 了 广泛 的 应 用 , 包括 NLP 任务 , 证 券 市 场 价 
格 预测 等 。 


2 
2.1 


图 1 LSTM 记忆 单元 结构 
Fig.1 Structure of LSTM memory unit 
基于 DMD 和 LSTM 的 股票 价格 预测 方法 


模型 数据 集 构造 
在 时 间 序列 分 析 中 ， 数 据 样本 通常 采用 滑动 时 间 窗 技术 


ChinaXiv 合 作 期 刊 


定稿 史 建 顶 ， 等 : 基于 DMD-LSTM 模型 的 股票 价格 时 间 序 列 预测 研究 第 37 卷 第 3 期 


并 取 窗 口 后 一 天 的 收盘 价 为 作为 预测 目标 。 通 过 不 断后 移 ， 
形成 一 系列 相互 覆盖 的 样本 数据 ， 在 降低 数据 时 变 特性 的 同 
时 ， 利 用 了 数据 的 时 序 信息 。 


| QQ NK 数据 一 一 一 一 > | 


Feat: 所 有 特征 Target: L+1 的 close 
样本 时 间 步 工 


出 


图 3 LSTM 数据 集 样 本 切 分 构建 
Fig.3 Construction of LSTM dataset 

最 终 得 到 的 数据 集中 不 同 特征 值 范围 差异 较 大 ， 不 利于 
LSTM 模型 收敛 ， 同 样 需要 对 LSTM 数据 集中 特征 分 别 进行 
归 一 化 操作 来 调整 数据 分 布 。 
2.2 基于 DMD 模 态 分 解 的 特征 提取 

DMD 算法 适用 于 复杂 系统 分 析 ， 但 其 应 用 于 股票 市 场 
的 前 提 假 设 是 : 股票 市 场 是 整体 相关 的 复杂 系统 ， 即 某 个 行 
业 板 块 的 股票 价格 波动 可 能 受到 相关 行业 板块 的 影响 。 在 此 
基础 上 利用 DMD 分 别提 取代 表 过 去 n 天 的 市 场 整体 趋势 变 
化 和 特定 股票 价格 变化 的 模 态 特征 ， 捕 捉 股 票 价 格 变化 的 动 
态 特 性 和 潜在 行为 模式 。 实 证 研究 中 DMD 算法 的 应 用 对 象 
来 自 于 沪 深 股市 中 5 个 行业 板块 ,其 中 主导 行业 为 钢铁 行业 ， 
关联 行业 为 有 色 人 金属、 金属 制品 、 汽 车 制造 业 、 建 筑 业 。 
利用 DMD 对 数据 快照 矩阵 X 进行 模 态 分 解 后 可 以 获取 
整个 系统 的 动态 模 态 ， 以 特征 值 w 来 表示 。 特 征 值 分 解 顺 
序 对 应 着 市 场 动 态 模 态 信息 量 的 大 小 ， 将 系统 分 解 得 到 的 第 
一 个 特征 值 称 为 主导 特征 值 ， 又 称 主导 模 态 (domain 
mode) ， 其 代表 整个 市 场 的 主要 趋势 信息 。 由 于 特征 值 一 般 


EH 


来 进行 切 分 构建 ， 本 文 针 对 DMD 算法 和 LSTM 模型 的 不 同 


分 另 


提取 模 态 特征 (mode feature ) 的 源 数据 为 关联 行业 板块 下 M 


支 


过 滑动 时 间 窗 来 切割 源 数据 获取 DMD 算法 所 需 的 数据 快照 
和 矩阵 X。 为 了 消除 不 同 股 票 价格 间 的 差异 性 ， 对 数据 快照 


中 村 


I 进行 数据 样本 构建 。 


asoID 


滑动 时 间 窗 


数据 快照 X 

图 2 DMD 数据 快照 矩阵 切 分 构建 
Fig. 2 Construction of DMD Snapshot matrix 

图 2 展示 了 DMD 数据 快照 矩阵 的 构建 过 程 。.DMD 算法 


本 股 的 N 天 的 收盘 价 数据 集合 ， 设 定 滑 动 步 长 为 1， 通 


本 股 数据 分 别 进行 归 一 化 (minmax scaler) 处 理 。 
LSTM 模型 进行 建 模 的 数据 为 股票 的 基本 面 特征 (raw 


feature) 和 提取 的 DMD 模 态 特征 数据 组 成 。 设 滑动 窗口 宽 
度 为 L, 采用 滑动 时 间 窗 从 数据 集中 截取 数据 单元 构建 样本 ， 


为 复数 ，Mann 中 指出 当 特 征 值 位 于 在 单位 圆 外 ， 其 模 值 大 于 
1， 意味 着 市 场 有 扩张 趋势 ， 当 特征 值 位 于 在 单位 圆 内 ， 其 模 
值 小 于 1， 市 场 有 紧缩 趋势 ， 当 特征 值 位 于 在 单位 圆 上 时 ， 
表示 市 场 整体 趋势 平稳 。 特 别 对 于 位 于 横 轴 没有 虚 部 的 特征 
值 ， 对 应 模 态 下 的 市 场 趋势 变化 速率 是 指数 形式 的 ， 因 此 该 
模 态 对 于 系统 的 影响 相 比 于 其 他 模 态 更 加 显著 ， 是 主导 市 场 
变化 的 重要 因素 之 一 。 

4 为 某 个 时 间 窗 为 20 的 数据 快照 矩阵 X 进行 DMD 
模 态 分 解 运算 的 结果 。 左 子 图 为 分 解 得 到 的 特征 值 w 在 复 平 
硬 上 的 分 布 ， 对 应 于 总 体 市 场 的 模 态 特征 ， 右 子 图 为 经 过 
傅 里 叶 转 换 后 的 wx 在 复 平面 的 分 布 。 图 中 三 角形 点 为 单位 赂 
外 包含 扩张 趋势 信息 的 特征 值 ， 对 应 于 复 平面 中 实 部 大 于 0 
的 we 。 


0.01 


Imag(lamda) 
8 

Lo a 

Imag(lamda) 


0.0 1.1 -1.1 0.0 
Real(lamda) Real(lamda) 
图 4 市 场 模 态 特征 分 布 


Fig.4 Distributions of market’s mode feature 
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史 建 楠 ， 


等 
图 5 为 选取 的 鞍钢 股份 (sh00898) 经 过 DMD 分 解 得 到 
的 前 10 个 动态 模 态 ， 来 源 于 特征 向 量 y， 对 应 价格 趋势 变 
化 中 不 同 层次 的 潜在 信息 。 前 三 个 主要 模 态 值 大 于 0 呈现 扩 
张 趋势 ， 后 面 影响 因素 较 小 的 模 态 值 小 于 0 呈现 下 跌 趋势 。 


ol 四 国 


A 十 
-0.10] 
2 4 6 8 


Mode number 


D mode value 


M 
出 
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图 5 鞍钢 股份 分 解 得 到 的 动态 模 态 
Fig.5 DMD mode value of decomposition’s result(Angang Steel) 
2.3 DMD-LSTM 价格 预测 模型 
本 文 综合 DMD 算法 和 LSTM 模型 来 进行 股票 价格 预测 ， 
DMD 算法 用 来 对 特定 板块 下 的 股票 集合 的 日 收盘 价 数据 快 
照 进 行 分 解 计算 来 提取 模 态 特征 ，LSTM 结合 股票 市 场 的 基 
本 面 特征 和 提取 的 模 态 特征 来 进行 模型 训练 ， 将 股票 收盘 价 
的 一 步 预测 问题 转换 为 监督 学 习 问 题 。 
股票 市 场 形态 主要 分 为 单 边 形态 、 震 荡 形 态 、 平 稳 形 态 
和 其 他 特定 形态 ， 不 同 的 市 场 形态 下 数据 变化 情况 不 同 ， 模 
型 的 预测 效果 存在 差异 。DMD 主要 依据 数据 历史 趋势 来 进 
行 模 态 的 提取 , 因此 模 态 分 解 得 到 的 结果 存在 一 定 的 滞后 性 。 
当 市 场 处 于 单 边 形 态 时 ，DMD 抽取 的 模 态 在 市 场 趋势 惯性 
下 能 较为 准确 的 抓 取 市 场 变化 的 趋势 信息 ， 当 市 场 处 于 震荡 
市 场 的 时 候 ， 由 于 澡 后 性 会 使 得 DMD 分 解 得 到 的 模 态 对 市 
场 趋势 变化 的 跟踪 效果 会 减弱 。 因 此 本 文 分 别 就 单 边 上 涨 、 
单 边 下 跌 、 震 荡 三 种 不 同 的 市 场 形 态 进行 实证 研究 。 
LSTM 对 股票 价格 进行 建 模 需 要 指定 数据 的 时 间 步 和 合 
适 的 特征 。 设 定 LSTM 模型 的 样本 时 间 步 L=20， 样 本 特征 
由 两 部 分 总 计 9 维特 征 组 成 ， 其 中 基本 面 特征 包括 单 只 特定 
股票 的 交易 日 收盘 价 Cclose)、 开 盘 价 (open)、 最 高 价 (high)、 
最 低 价 (low) 、 成 交 量 (volume) 5 维特 征 ，DMD 模 态 特 


征 为 市 场 主导 模 态 特征 和 对 应 股票 的 前 3 个 动态 模 态 特征 共 
计 4 维特 征 。LSTM 模型 的 网 络 结构 和 参数 设置 决定 着 模型 
的 性 能 ， 因 此 需要 通过 相关 指标 定量 的 评价 网 络 模型 预测 性 
能 来 获取 最 优 的 网 络 结构 配置 ， 实 现 股票 价格 与 特征 关系 最 
佳 映 射 。 


在 确定 LSTM 模型 结构 后 ， 基 于 已 训练 的 模型 对 测试 集 
样本 进行 预测 。 在 DMD-LSTM 单 模型 基础 上 ， 根 据 模 型 融 
合 的 思路 ， 将 DMD-LSTM 模型 和 基于 基本 面 特征 的 LSTM 
单 模型 的 预测 结果 加 权 平 均 作 为 预测 值 。 最 后 对 预测 价格 进 
行 反 归 一 化 转换 为 实际 价格 量 纲 ， 通 过 评价 指标 来 判断 模型 
预测 性 能 ， 整 体 模型 预测 流程 见 图 6。 


3 ”实证 分 析 
3.1 数据 来 源 
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取 2017-05-08 到 2017-08-02 的 股票 价格 单 边 上 涨 期 ， 共 计 
60 天 数据 作为 验证 集 ， 对 应 选取 2014-05-27 到 2017-05-07 
约 700 个 交易 日 数据 作为 训练 集 ; 选取 2017-02-22 到 
2017-05-22 的 股票 价格 单 边 下 跌 期 , 共计 60 天 数据 作为 验证 
集 , 对 应 选取 2017-05-27 到 2017-02-21 约 650 个 交易 日 数据 
作为 训练 集 ; 选取 2017-09-27 到 2017-12-27 的 价格 震荡 期 ， 
共计 60 天 数据 作为 验证 集 ， 对 应 选取 2014-05-27 到 
2017-09-26 约 800 个 交易 日 数据 作为 训练 集 。 实 验 数 据 来 源 
于 新 浪 财经 接口 , 数据 集 样本 的 划分 构建 和 预 处 理 见 2.1 节 。 


Er 
yu 


对 数据 归 一 化 处 
理 ， 利 用 滑动 时 间 
窗 获 取 数据 样本 


构建 DMD 分 解 计算 所 


需 的 数据 快照 矩阵 基本 面 数据 特征 


利用 DMD 分 解 的 主导 
模 态 和 样本 股 动态 
模 态 作为 DMD 特 征 


LSTM 通 过 训练 实现 
一 步 预测 ， 获 取样 
本 股 后 一 天 收盘 价 


LSTM 通 过 训练 实现 
一 步 预 测 ， 获 取样 
本 股 后 一 天 收盘 价 


模型 融合 ， 将 两 种 
预测 结果 加 权 平 均 


对 预测 值 反 归 一 化 
为 原来 的 量 纲 


计算 评价 指标 来 检 
验 模型 预测 效果 


图 6 DMD-LSTM 模型 进行 股票 价格 预测 流程 图 
Fig.6 Prediction procedure of DMD-LSTM model 

3.2 ”模型 评价 指标 
在 对 模型 预测 效果 进行 定量 评价 时 ， 本 文 对 于 价格 预测 

能 力 的 评价 指标 选取 为 均 方 根 误 差 RMSE、 平 均 绝对 误差 
MAE、 确 定 系 数 R2?， 其 中 RMSE 和 MAE 越 小 ,模型 对 于 真 
实 值 拟 合 的 偏差 越 小 ， 结 果 越 准确 ;确定 系数 R? 越 接近 1， 
代表 拟 合 优 度 越 大 ， 模 型 拟 合 数据 能 力 效果 越 好 。 价 格 趋势 
变化 预测 能 力 的 评价 指标 选取 为 方向 准确 率 DA， 其 定义 为 
模型 对 股票 价格 变化 方向 预测 的 准确 性 , 具体 公式 定义 如 下 : 


RMSE = E36-» (21) 


R? =SSR/SST = >,($ —7)? 和 >.0; -7 (22) 
I 

MAE = 六 之 | 人 一 (23) 
1 N 

DA= TZ (24) 


选取 钢铁 行业 板块 中 的 鞍钢 股份 (sh00898) 为 研究 对 象 ， 
同时 为 了 配合 DMD 计算 需求 ， 选 取 钢 铁 行业 及 相关 行业 下 
共计 117 支 股 票 的 收盘 价 来 构建 数据 快照 。 

鉴于 市 场 形 态 的 不 同 ， 本 文 分 别 就 股票 单 边 上 升 期 ， 单 
边 下 降 期 和 价格 震荡 期 三 种 市 场 形态 进行 实证 研究 。 源 数据 
为 鞍钢 股份 2014-05-27 到 2018-05-27 期 间 的 日 交易 数据 , 选 


其 中 :为 真实 值 和 预测 值 对 比 次 数 ，5 为 模型 预测 值 ， y; 
为 真实 值 ， 了 为 y 的 均值 ，4d; 为 预测 方向 标志 位 ， 方 向 预测 
正确 d; 置 1， 方向 预测 错误 d; 置 0。 

3.3 DMD-LSTM 模型 预测 方法 实现 

3.3.1 DMD 模 态 特征 提取 

DMD 通过 模 态 的 提取 来 描述 价格 的 变化 规律 ， 其 中 市 
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场 主导 模 态 的 变化 代表 着 市 场 总 体 趋 势 随 着 时 间 变化 的 规 


律 。 如 图 7， 主 导 模 态 模 值 总 体 


下 每 本 


围绕 1 进行 


波动 ， 对 于 模 值 
偏离 1 的 模 态 ， 代 表 市 场 中 有 较 强 的 上 涨 或 者 下 跌 的 动力 。 


主导 模 态 模 值 


0 


图 
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7 市 场 主 时 模 态 的 时 间 序 


1000 


Fig.7 The curve of market’s domain mode value 


图 8 为 鞍钢 股份 全 量 数据 进行 
个 主要 的 动态 模 态 的 日 变化 曲线 。 汤 吕 


相对 来 说 变化 较 缓 ， 可 看 做 低频 信 


DMD 模 态 分 解 后 ， 前 三 
股票 价格 中 长 期 走势 


; 而 短期 价格 走势 波动 


较 大 ， 可 看 做 高 频 信 号 。 类 似 的 ， 动态 模 太 1 可 看 做 低频 高 
能 量 模 态 ， 其 波动 范围 较为 稳定 ， 表 示 该 股票 的 价格 变化 趋 


势 相对 较 慢 。 模 态 2、 


模 态 1 为 高 频 低能 量 的 模 态 ， 
波动 会 比较 显著 。 


3 波动 相 较 于 模 态 1 有 所 增加 ， 相 比 于 
波动 相对 较 大 ， 说 明 短 期 价格 
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图 8 鞍钢 股份 前 三 个 主要 模 态 的 变化 
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Fig.8 The curve of the first three mode values(Angang Steel) 
3.3.2 LSTM 模型 结构 选 定 


神经 网 络 的 
J 


了 客观 分 析 模型 


的 真实 预测 能 


， 消 除 参数 选取 差异 对 实证 


网 络 结构 和 参数 设置 决定 着 模型 的 性 能 。 为 


参照 上 述 参数 配 
型 参数 ， 基 于 


股票 价格 


为 无 监督 的 数 和 
青 度 较 差 ， 
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Fig.9 The loss in LSTM training of single market 


过 程 ， 选 取 对 比 实 验 模 型 


3.3.3 结果 对 比 与 分 析 
为 了 检验 模型 的 真实 预测 性 能 ， 消 除 
实证 中 针对 不 同 的 市 场 情况 , 分 别 对 每 种 模型 进行 10 次 实验 
来 取 平 均 结 果 进 行 比 较 。 
格 单 边 上 涨 阶段 ， 
结果 如 表 1 所 示 。SVR 模型 
ee 实证 中 以 两 者 的 预测 结果 作为 基准 进行 对 比 。DMD 


的 最 佳 的 模 
F RBF 核 的 支持 向 量 回归 机 (SVR) 的 正则 化 系数 
和 gamma 参数 组 合 为 (4，0.1) ; 基于 SGD 优化 
最 佳 的 学 习 率 、 隐 层 层 数 、 隐 层 节 点 数 、 
为 (0.15，2，40，4500) ，DMD 滑动 窗口 
边 下 降 和 震荡 


的 BP 神经 


epoch 的 参数 组 合 
参数 为 20。 对 于 
E 态 ，LSTM 模型 参数 配置 过 程 相 


市 场 趋势 总 


4 和 BP 模型 


A 因素 的 影响 ， 


体 走强 ， 相 关 模 型 
4 作为 传统 的 预 


居 挖 气 方 法 ， 


结果 的 影响 ， 本 文通 过 模型 参数 调 优 实现 股票 价格 与 特征 关 


系 的 最 佳 映 射 。 


本 文 的 LSTM 模型 结构 由 输入 层 、 两 层 LSTM 层 和 输出 


层 组 成 ， 损 失 函 


Adam 算法 进行 
经 元 个 数 、 训 练 次 数 和 了 
Tensorflow 框架 下 


以 股票 价格 单 边 上 涨 情况 为 例 ， 


数 使 | 


程 如 下 : 首先 固 


实现 。 


定 训练 次 数 epoch=800， 进 行 隐 层 神经 元 个 


数 和 学 习 率 的 调 


30 间隔 为 2 进行 


到 0.001 进行 选 
层 节 点 数 和 学 习 


节 ， 将 两 层 LSTM 


] 均 方 根 误差 ， 模 型 训练 过 
优化 。 模 型 参数 选择 上 包括 学 习 
E 则 化 参数 ， 网 络 模 型 的 搭建 在 


过 程 中 采用 


率 、 隐 层 4 


经 网 络 调 参 过 


居中 的 节点 个 数 从 10 到 
选取 ,调节 学 习 率 以 间隔 为 0.0001 从 0.0001 
取 ， 两 者 总 计 100 组 参数 ， 确 定 最 佳 的 的 隐 
率 组 合 为 (14，14，0.0005 ) 
会 对 模型 的 预测 精 


。epoch 的 大 小 
度 和 运行 效率 造成 较 大 影响 ， 较 大 的 


epoch 导致 运行 效率 低 并 可 能 伴随 过 拟 合 现 象 , 较 小 的 epoch 


会 使 模型 训练 不 充分 出 
训练 过 程 中 loss 关于 


阮 欠 拟 合 现象 。 图 9 为 LSTM 模型 在 


F epoch 的 变化 1 


线 ， 根 据 loss 变化 曲线 


确定 最 佳 epoch 为 140。 为 了 增加 模型 泛 化 能 力 消除 过 拟 合 


现象 ， 本 文 在 LSTM 网 络 结构 中 增 ] 


数 为 0.0001。 


E 则 项 ， 正 则 项 系 


记 DA 值 
。 个 结果 差异 较 大 的 模型 
结果 。 


态 特征 一 定 程度 上 包含 着 市 场 行为 变化 的 潜在 


高 LSTM 模型 的 预测 精度 , 其 在 RMSE 指标 


结果 可 知 


均 22.60%， 主 要 原 
息 从 市 场 行 为 中 发 掘 趋势 变化 的 有 
于 其 他 单 模型 ， 
DMD 提取 的 


其 在 价格 预测 上 的 
在 RMSE 指标 上 比 基 准 水 平 低 了 平均 35.61%。 
6 场 趋势 较为 显著 ，DMD 在 价格 趋势 方向 的 预测 准确 
性 相对 较 高 ，DA 指标 比 基 准 模型 高 了 平 
DMD 能 利用 时 序 信 
效 信息 。DMD-LSTM 模型 的 价格 预测 精度 高 
仅 利用 基本 面 指标 的 LSTM 模型 ， 这 说 明 


言 筷 


台 尼 有 昌 
Bi/ 能 提 


基准 水 平 高 


了 平均 12.02% 。 在 模型 融合 方面 ， 将 LSTM 单 模型 和 
D-LSTM 单 模 型 的 预测 结果 进行 加 权 平 均 ， 价 格 预测 精 


上 DMD-LSTM 模型 高 了 1.34%， 同 时 模型 的 模型 拟 合 优 


也 有 所 提升 ， 实 现 了 预测 效果 的 最 优 。 图 10 
4DMD、BP、 融 合 模型 的 


收盘 价 /元 


a 
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加 


a 
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加 


a 


一 一 REAL 
一 一 DMD-LSTM 
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图 10 单 边 上 涨 形 


区 态 下 模型 预测 结 


图 


Fig. 10 Comparison results of various models in stronger market 
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1 单 边 上 涨 阶 段 各 模型 预测 结果 比较 
Table 1 Comparing the predict results of various models in stronger 
market 
预测 模型 RMSE MAE R2 DA 
SVR 0.1160 0.0879 0.9307 0.4576 
BP 0.0921 0.0708 0.9564 0.4548 
DMD 0.1389 0.1136 0.9006 0.5593 * 
LSTM 0.0914 0.0702 0.9570 0.5198 
DMD-LSTM 0.0898 0.0698 0.9592 0.4934 
融合 模型 * 0.0886 * 0.0686 * 0.9596 * 0.5127 


股票 价格 单 边 下 跌 阶 段 ， 市 场 总 体 走 弱 ， 相 关 模 型 的 预 
测 结果 如 表 2 所 示 。 类 似 于 单 边 上 涨 形态 的 预测 结果 , DMD 
在 价格 预测 方 
然 好 于 BP 和 SVR 两 种 基准 模型 。DMD-LSTM 在 单 模型 上 


面 精度 较 差 ， 但 在 预测 价格 趋势 方向 准确 性 


的 预测 精度 和 LSTM 单 模型 相当 ,取得 了 较 高 的 预测 准确 性 ， 


RMSE 误差 比 基 准 模型 低 了 平均 17.17%。 值得 注意 的 是 该 相 
型 在 这 个 市 场 形 态 下 的 预测 DA 值 相对 较 高 ， 


这 与 单 边 上 涨 


情况 的 预测 情况 不 同 ， 可 能 原因 是 单 边 市 场 下 的 局 部 波动 导 
致 了 这 种 不 稳定 的 情况 。 在 模型 
权 平 均 后 的 预测 误差 RMSE 在 DMD-LSTM 模型 的 基础 上 进 
一 步 下 降 了 3.72%， 同 时 模型 拟 合 优 度 最 佳 且 DA 值 最 大 ， 
实现 了 模型 预测 性 能 的 最 优 。 


融合 方面 ， 预 测 结果 进行 加 
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图 11 单 边 下 跌 形态 下 模型 预测 结果 对 比 图 
Fig. 11 Comparison results of various models in weaker market 


表 2 单 边 下 跌 形态 下 各 个 模型 预测 结果 对 比 


Table 2 Comparing the predict results of various models in weaker 
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Ba 


权 进 行 模型 融合 后 ， 


小 幅度 提升 , 但 不 排除 偶然 


基 


此 其 预测 精度 低 于 LSTM 模型 。 进 
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步 将 预测 结果 平均 加 
尽管 预测 结果 的 RMSE 和 R? 都 实现 了 
素 导 致 的 影响 。 实 证 结果 表明 ， 


Ba 


于 DMD-LSTM 模型 的 股票 价格 预测 方法 在 市 场 震 荡 的 情 
况 进 行 应 用 还 存在 一 


定 的 缺陷 。 
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图 12 震荡 阶段 下 模型 预测 结果 对 比 图 


Fig. 12 Comparison results of various models in shocking market 
表 3 震荡 阶段 下 各 个 模型 预测 结果 对 比 


Table 3 ”Comparing the predict results of various models in shocking 


market 
预测 模型 RMSE MAE R2 DA 

SVR 0.1222 0.0956 0.5561 0.4746 

BP 0.1183 0.0934 0.5830 0.5627 

DMD 0.2012 0.1600 -0.2033 0.5254 
LST™ 0.1109 0.0908* 0.6340 0.5720 * 

DMD-LSTM 0.1150 0.0965 0.6059 0.4814 

融合 模型 * 0.1106* 0.0930 0.6359* 0.5322 


4 ”结束 语 


本 文 提 


md 


8 的 基于 DMD-LSTM 模型 的 股票 价格 预测 方 


法 ， 从 国内 股市 相关 行业 板块 存在 的 关联 效应 出 发 ， 通 过 


DMD 算法 进行 模 态 特征 提取 来 获取 行业 板块 间 的 潜在 关联 


忆 素 和 趋势 信息 ， 然 后 将 LSTM 模型 应 用 于 股票 价格 预测 ， 
充分 的 利用 了 时 序 信息 和 模 态 特征 。 
通过 鞍钢 股份 不 同市 场 背 景 下 的 对 比 实验 表明 ， 相 比 于 


l 


传统 机 器 学 习 预 测 方法 ， 本 文 模型 在 单 边 市 场 趋 势 显著 的 前 


提 背 景 下 ， 能 取得 更 加 准确 的 预测 结果 ， 包 括 更 低 的 预测 误 


差 和 更 高 的 方向 准确 性 。 这 表明 在 单 边 市 场 情况 下 ， 行 业 板 


market 
预测 模型 RMSE MAE R2 DA 
SVR 0.1094 0.0809 0.9104 0.4746 块 关联 效应 较为 显著 ， 利 
BP 0.1247 0.0968 0.8834 0.5051 
DMD 0.1593 0.1268 0.8102 0.5424 
LSTM 0.0984 0.0801 0.9275 0.5424 
DMD-LSTM 0.0989 0.0798 0.9235 0.5953 的 趋势 信息 。 之 后 工作 将 进 
融合 模型 * 0.0970* 0.0772* 0.9294* 0.5953* EF 


测 结果 刀 


DMD 方法 进行 有 效 的 模 态 特征 提取 的 前 提 是 市 场 趋势 
存在 延续 性 ， 当 市 场 进入 震荡 调整 期 行业 板 块 联动 效应 较 
弱 ，DMD 算法 较 难 从 短期 的 时 间 序 列 数据 中 分 解 出 有 效 的 
趋势 信息 。 

股票 价格 震荡 阶段 ， 价 格 波动 变化 较 大 ， 相 关 模 型 的 预 
[ 表 3 所 示 。 由 于 预测 结果 滞后 性 严重 ，DMD 算法 
对 于 价格 的 拟 合 预测 精度 出 现 大 幅 下 降 ， 
表明 无 法 进行 有 效 的 价格 预测 。 相 比 于 其 他 
模型 的 预测 精度 最 高 ， 由 于 行业 板块 下 提取 的 趋势 变化 的 信 


拟 合 优 度 为 负数 ， 


模型 ，LSTM 


` 准 确 ，DMD-LSTM 中 的 模 态 特征 相当 于 引入 外 部 噪声 ， 


 DMD 提取 的 模 态 特征 能 有 效 提 


升 模型 的 预测 性 能 。 在 震荡 市 场 情况 下 , 模型 效果 并 不 理想 ， 
其 原因 在 于 市 场 价格 波动 明显 ， 价 格 变化 影响 因素 复杂 ， 行 


业 板 块 联动 效应 较 弱 ， 相 关 模 态 特 征 提取 方法 很 难 获取 有 效 


步 研究 震荡 市 场 情况 下 ， 板 块 


关联 效应 同 动态 模 态 特征 提取 间 的 关系 。 
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